De Verbatim a Gist: Destilación de la Memoria Multimodal Piramidal a través del Cuello de Botella de Información Semántica para Agentes de Video a Largo Plazo
Destilación de la memoria multimodal piramidal para agentes de video. Desarrollo de una tecnología innovadora que potencia la capacidad de aprendizaje de los agentes de video a través de la integración de múltiples modalidades de memoria.